谭寅亮:突围与蝶变——中国大模型发展方兴未艾
与以往任何一场颠覆性的技术革新相比,大模型似乎都来得更为猛烈,影响也更为深远。经过了2023年的大模型“元年”,如今,它正站在爆发前夜,探寻着商业落地的路径。
在这个赛道,中国处于世界第一梯队,特别是中国的千行百业,市场需求大、场景多、数据丰富,使垂直大模型展现出了显著优势,为效率提升、产业升级赋能。诸多厂商也已经布局,“百模大战”正在上演,相关应用“破圈”频繁引发热议。
但算力、数据、资本、人才的普遍不足仍是未来大模型发展的掣肘,而技术的突破也带来了新的风险挑战,大模型产生的争议与法律纠纷也让人们看到了它背后的隐忧。
2024年,大模型的竞争愈发激烈。近日,斯坦福大学某AI团队被曝疑似抄袭中国大模型创业公司面壁智能的创新成果,引发广泛关注。人们这才意识到,几年的时间里,中国在大模型这条赛道上已不再是单纯的追随者,而是展现出了与世界一流团队一较高下的底气和实力。
在人工智能技术演进中,大模型是一个重要分支。在2022年11月OpenAI公司发布GPT-3.5之前,大模型还在黑暗中不知前路。但随着以ChatGPT为代表的生成式人工智能产品成为现象级应用,人们终于意识到,这条探索之路走得通,也可以走得远。
如今,人工智能的发展迈入新阶段,千行百业迫切与之深度融合。全球都试图搭上这趟时代的列车,而中国以自身独特的方式,拉开了大模型商业化变现的大幕。
百模大战
1956年夏天,美国达特茅斯学院的一场闭门会议首次提出了“人工智能”概念,被认为是人工智能诞生的标志。进入20世纪八十年代,人们开始涉足人工智能背后的核心——神经网络算法的研究,但受限于算力和数据资源,人工智能并未如预期一般迎来大规模发展。
人工智能的浪潮在2017年达到高峰。谷歌大脑团队发表了一篇著名的论文,提出了全新的transformer架构。也正是这个架构,最终成就了OpenAI和ChatGPT。
6月4日,中欧国际工商学院决策科学与管理信息系统教授谭寅亮在接受《法人》记者采访时称:“数据量越多,参数量越高,模型性能提升越明显,这正是大模型的特点,被形象地称为‘大力出奇迹’。”
▲CFP
“大模型的技术进步并非线性发展,而是跳跃式、跨越式发展。”北京瑞泊控股(集团)创始人乙壤月称,OpenAI的每一次产品发布,都不是小幅度的改进,而是大胆的飞跃,足以震撼世界,这是一种“暴力美学”。
2024年4月16日,斯坦福大学以人为本人工智能研究所发布《2024年人工智能指数报告》,揭示了全球人工智能最新动态。报告显示,2023年,全球共发布149个通用大模型(大模型分通用大模型和垂类大模型,前者指具有广泛适用性的大型生成式人工智能模型,可以表现出类似于人类智能的通用性和适应性,后者是指针对特定行业或领域进行训练的大模型),这一数量是2022年的两倍有余。
在这轮生成式人工智能的竞赛中,中美处于世界第一梯队。根据上述报告,2023年,美国共研发了61个通用大模型,中国紧随其后,发布了15个,法国、德国和加拿大分别为8个、4个和4个。这些数字从侧面反映出不同国家在人工智能领域的整体科技实力、资金投入和人才培养情况。
其实,中国早在2017年便开始发展人工智能产业,其热度在2019年达到顶峰,之后出现回落。当时,市场对其可能性提出质疑。但当生成式人工智能的浪潮席卷全球后,国内发展热情被迅速被点燃,科技巨头、初创企业、研究院等纷纷躬身入局。2023年上半年,百度发布“文心一言”,商汤科技发布日日新,阿里巴巴发布通义千问,同年下半年,华为云推出盘古大模型3.0……各方力量争奇斗艳,被形象地称为“百模大战”。
截至2024年4月2日,国家网信办发布公告称,目前已有117款生成式人工智能服务通过备案,其中北京51款、上海24款、广东19款,大部分为垂类大模型。
在谈到当前市场格局时,中国信通院华东分院人工智能事业部主任常永波给记者列举了百度、阿里巴巴、字节跳动、华为和腾讯等互联网领军企业,“它们具有雄厚的技术积累和创新能力,研发的产品在行业中处于领先地位”。此外,他还特别指出,一批新兴独角兽企业,如智谱AI、百川智能、月之暗面、MiniMax和零一万物等,成立时间虽短,但已凭借超过10亿美元的融资规模和卓越的研发成果,在大模型领域崭露头角。
四大掣肘
当前,中国大模型发展热火朝天,但无法回避算力、数据、人才和资金方面我们存在的问题。
大模型算力的增强需要依赖强大的硬件支持,即高性能的AI芯片。“目前,美国在算力方面拥有领先优势,一些高性能芯片被禁止向中国大陆市场出售,因此,国内算力被卡脖子,企业只能使用本土芯片。”广东民营投资股份有限公司副总裁欧文志称,“从中长期发展来看,国产算力自主是大模型发展的核心,其底层是国产高端芯片产业链的发展,相信今年正式官宣的国家大基金三期会在这个方向重点投入。”
数据的质量和数量对大模型优化至关重要。现代大模型对数据的渴求已经到了前所未有的高度,它们需要的数据量是过去的十倍甚至百倍。常永波强调:“无论数据的数量还是质量,都需要在特定行业或场景中进行长期积累。此外,还需要行业机构愿意分享其拥有的数据。但由于目前数据流通环节不可控,导致很多数据拥有者不敢开放数据。”对此,乙壤月也表示,虽然中国的数据总量超过美国,但数据质量不够好,这对中国大模型的发展形成了一定掣肘。
大模型技术的爆发期与人才培养周期之间存在时间差,这导致具备高级人工智能素养和深入理解大模型技术路线的人才十分稀少。乙壤月说:“大模型火爆之前,国内真正从事大模型的专业技术人员只有数百人,人才短缺并非中国独有,全球范围都面临这个问题。甲方在寻找优秀大模型人才时,往往需要付出巨大的人力成本。”据悉,一位具备专业技能的大模型技术人员,年薪也要100万元以上,技术负责人则接近千万元。
随着大模型规模的扩大,训练成本上升也成为不可避免的趋势。据业内估计,大模型一次训练费用可能高达数千万元,这无疑对企业的资金实力提出了严峻考验。在大模型企业的成本结构中,算力成本通常约占总成本的六成。因此,大模型本质上是一个需要巨额资本投入的领域。
眼下,大模型给中国带来了一场资本盛宴,这条赛道在当下国内的股权投资市场属于一股清流。欧文志称,当前,大模型是为数不多的、资本仍愿意投资的“高景气、高亏损”赛道,类似于当年的芯片、创新药,背后代表着投资人对其发展前景的高度预期。“大模型产业发展如此之快,一时间涌现了这么多独角兽企业,竞争如此激烈,背后正是资本对该赛道的快速押注。”
如今,对于很多大企业来说,AI或是一张续命的船票,或是企业变革的关键。以阿里巴巴为代表,该公司押注了国内6家独角兽中的5家,而腾讯担心错失机会,除投资光年之外、MiniMax、智谱AI和百川智能,自己也在研发大模型,投资与自研并行。
肉眼可见,对通用大模型的投资,资方紧盯着头部的几家企业。常永波也坦言:“通用大模型不是一般的初创企业、小型资本能玩得转的,这让一些创业企业面临很大的资金压力。”
另辟蹊径
中国需求规模大、产业配套全、应用场景多,业内普遍认为,垂类大模型是将来中国最具竞争力的方向。谭寅亮称:“人工智能要实现对生产力的提升,需要通过应用,而应用离不开数据,中国的场景更丰富,场景带来的不仅是产业的动力,还有数据的多样性。”
垂类大模型需要针对特定行业和场景进行定制化和优化。东方财富人工智能首席科学家刘志毅观察到,越来越多的金融企业、医院、律师在积极寻找与大模型的结合点,“从这个角度看,我认为中国在大模型方面的发展潜力更大”。
刘志毅将大模型技术创新者的研究比喻成攀登珠穆朗玛峰:“美国的技术创新者选择了一条充满挑战的路线,即通用人工智能的研发,这如同攀登珠峰的北坡,技术难度极高。他们追求的是技术极客的理想,致力于创造能与人类相媲美的人工智能。而中国的大部分创新者则选择了南坡,在底层技术积累相对较少的情况下,走上一条更为务实的道路——产业智能化和应用产品化。尽管南北坡路线不同,但最终都将到达一个顶峰,就是整个社会的智能化。就像《月亮与六便士》,我们追求的是‘六便士’,但并不妨碍我们欣赏‘月亮’。”
▲在上海召开的世界人工智能大会吸引了众多参观者 CFP
对此,他预言:“由于中国大模型与产业结合得更加紧密,未来5到10年,除了出现独立的人工智能行业以外,还将出现与具体产业结合的智能化趋势,例如可能会涌现非常出色的智能金融产业、智能医疗产业、智能教育产业等。”他认为,这将是中国人工智能发展的一个显著特点。
目前,中国还处在人工智能产业化阶段,但再过几年,常永波认为,应该会走向产业人工智能化,各行各业的产品、管理、服务都会深入运用人工智能,全面融入人工智能,提升效率,进行产业迭代升级。根据大模型之家的数据,预计2028年,中国大模型市场规模将达到1179亿元;2022年至2028年,复合增长率约为60.11%。
构建生态
毋庸置疑,中国大模型生态很卷。企业忙着卷新产品的研发、典型的应用场景、落地的商业模式,谁能突出重围,推出一个可以形成示范效应的杀手级应用,谁就能脱颖而出。
如今,从“卷”参数到“卷”价格,多家企业大模型应用价格动辄下调90%以上,有的甚至直接免费。可见,大模型比拼已经进入白热化阶段。“大模型使用成本降低,趋近于免费,是未来的趋势,随之而来的是大模型快速普及。”乙壤月认为,这给一些规模较小、实力较弱的大模型企业带来了生存压力。
在国内“卷到极致”的发展趋势下,常永波敏锐地观察到了人工智能企业出海的现象。“一些企业家说,国内大模型赛道太卷了,能够在中国生存下来的企业,如果走向东南亚、欧美等其他市场,会显现出强大的竞争力。”
目前,美国众议院正在推进大模型出口限制法案,如果法案最终落地实施,谭寅亮认为,将影响中国企业在美国开源的大模型上进行二次开发。“因此,中国必须加强大模型自主研发能力,确保人工智能系统研发的自主性。大模型本土化替代显得尤为迫切。”他建议,行业领军企业应担起重任,开发开源的通用模型。
随着生成式人工智能的发展,其带来的模型幻觉、数据安全、个人信息保护以及科技伦理等方面的风险和挑战引发了全球关注,人工智能的全球治理正在被各国紧锣密鼓地提上议程。
2023年10月,在第三届“一带一路”国际合作高峰论坛上,中国提出了《全球人工智能治理倡议》;同年11月,中国、美国、英国等28国和欧盟签署了全球第一份针对人工智能的国际性声明《布莱切利宣言》;2024年3月,联合国大会通过了由美国牵头提出的决议案《抓住安全、可靠和值得信赖的人工智能系统带来的机遇,促进可持续发展》;5月14日,中美人工智能政府间对话首次会议在瑞士日内瓦举行;5月21日,韩国和英国在首尔共同主办了第二届人工智能安全峰会;同日,欧盟理事会正式批准了全球首个用于人工智能领域监管的法案《人工智能法案》,该法案不仅适用于所有欧盟境内的人工智能使用者,还包括位于欧盟以外的人工智能设备供应商。
可见,主要国家正致力于人工智能生态的打造,加强自身在国际舞台上的话语权。毕竟,在人工智能这一关键技术领域,拥有话语权意味着能够参与制定全球规则,引领技术发展方向,保护国家利益。
“人工智能这条路不仅需要技术本身的创新,还需要学者、企业、公众、国家的共同努力,需要整个组织架构、商业环境和文化生态的全面调整和创新。”谭寅亮说,“我们正处在人工智能的关键时刻,但这条路一定不会漫长。”
来源|《法人》杂志